#一
TURC.segai
深度学习在自然语言处理中的应用(陈恩红)
深度学习在自然语言处理应用的程度
语言模型,
字符级别,
分词.词性标注.命名实体识别-基于深度学习的序列标注算法,
文档分类-多层次文档分类,
encoder-decoder框架,
对话系统,
机器翻译-基于attention机制,
阅读理解,
图片标注生成
诗歌自动生成
基于规划的诗歌生成(主题规划(统计/知识))
诗歌生成模型-基于attention的句子生成模型
基于主题规划衍生出的多种产品形式
语音作诗,藏名诗,藏头诗。。。
基于语义的
弹幕
框架-视频时序标注框架(
语义表征(T-DSSM.损失函数基于对比学习),
视频高潮片段标注(整体主题分布,提取特征分布,))
词汇蕴含识别
是文本蕴含识别的重要组成部分
挑战:词义,蕴含关系的多样性
CENN(Centent-Enriched Neural Network)
试题难度预测
标准化测试(规则,公平性保障)
在线学习系统构造题库,试题标注
帮助教师改卷
英语阅读理解-挑战
TACNN模型框架(统一文本表示,量化文本对于不同问题的重要性,消除考试带来的难度不可比性)
NLP
#二
TURC.segai
Beyond Deep Supervised Learning for Visual Recognition(Liang Lin)
Deep Learning:the Engine of AI
Neural networks 神经网络
DNNS as A universal joint Learning framework/Engine
eg. cross-domain visual matching
network architecture:not a black box
应用:交通实时分析系统,人群分析系统
weakly-Supervised semantic Inpainting
recursive neural nets for scene parsing
task-oriented action prediction
knowledge-guided recurrent prediction
progressive and cost-efficient Learning(active self-paced Learning,communication)
unsupervised Representation Learning无监督的表达学习
#三
TURC.segai
Revolution Driving with Deep Learning(ن؛ژه‡¯ï¼ŒCEO,Horizon Robotics)
Horizon Robotic:è‡ھهٹ¨é©¾é©¶(و•ˆçژ‡ï¼Œن¾؟وچ·و€§ï¼Œه®‰ه…¨)
Deep Learning:
Non-cinvex& non-linear
intensive computation
Sensitive to initialization
over-fitting
vanishing gradient
big data
GPU
…
generalization error=A(Approximation)+E+O
hand-craft feature
deep neural networks
deep reinforcement Learning:alphago
و„ه»؛“ه¦ن¹ ç³»ç»ں",而ن¸چوک¯"被è®ç»ƒç³»ç»ں”(Learning from natural user behaviors and simulations)
The full-stack approach to"brain of car"
Algorithmic designing principles(transparency,large-scale training…)
Bayes networkè´هڈ¶و–¯ç½‘络
FPGA
#四
TURC
5.14
Alibaba(Jingren Zhou)
ACM(Vicki L. Hanson)
menber-driven,volunteer-led
ACM数字图书馆-recent and upcoming
practitioners
future of computing academy
ACM Awards:SIG awards,career-long contributions,Early-to-Mid-career contributions,student contribution,specific type of contributions
Diversity and Inclusion:women,disabled
http://www.notabletechnicalwomen.org/
Digital Vellum(牛皮纸):Defense Against the Dark Ages(Vinton Cerf)
Archiving Static Text/Image Content
Movies Digital Storage Dilemma(LTO Linear Tape Open)
Wha about executable content?
Interpreting Date(File)
22nd Century Doris Kearns Goodwin
1000 years?(old File format,encoding schemes,databases)
Challenges(interpretation of bits;
metadata capture;
source or executable code;
Digital X-ray;
capacity for BIG DATA;
bankruptcies,sunset of apps,OS,hardware;
intellectual property rights;
legal frameworks,exceptions for preservation)
Access Control
What happens when we die?
The OLIVE Project(Client Structure,
VM Image Representation,
Static snapshot of the web
The RHIZOME Project(
preservation of Digital artworks,
WebRecorder System)
Example Other Project(
the computer history museum,
google book scans and cultural institute
CNRI Digital object architecture and identifiers,
IPFSInterplanetary File System,
international internet preservation consortium,…)
Evolution of the artificial visual system(Wen Gao)
the city brain for Hangzhou(to slove traffic problem)
the platform of city brain
video processing system in cloud
video sensing in city brain
signal timing optimization
issue:
off-line training(目前无法实现on-line training),数据面向存储,
BigMM Data Chanllenges in Smart City(Storage,retrieval模式识别,identify),
Artificial visual system Challenge("city eye"摄像头功能简单)
1C1S-one camera one stream 摄像头单流
weakness: long delay,low accuracy(QP=38下界,意味着Bitrate=2.4M),feasible.
QP-Quantization parameter
for face detection
MCMS-多摄像头多流
SCDS-具有编码和特征提取功能的摄像头(问题:rate-distortion optimization(
1.图像编码优化-剔除编码冗余(时间上,空间上,本身的)-使用基于模型的编码);
2.视频特征提取的优化(SIFT Feature,CDVS(推荐),CNN(深度学习));
3.联合R-D 与 R-A优化)
Syntax
“数字视网膜”-前端摄像头
Game Theory in Economic and FinTech(金融科技)(Andrew Chi-Chih Yao)
IIIS-Institute for Interdisciplinary Information Sciences
diamond-based quantum computer
FinTech:
way(makingtradional services.moreefficient,novel new services)
why(
new golden age of computer Science(quantum computer,Economics,Google:alphabet holding Co. ,harbinger:possible role reversals))
new scientific drivers of FinTech(
AI/Big Data,
Theory of building reliable distributed systems,
Theory of cryptography,
Game Theory(math models of conflict and cooperatation,k-items))
#五
TURC
人工智能时代的科学家创业
3.12
李开复博士
创新工厂投资案例
Face++ 支付宝 马云
智融集团 用钱宝 利用AI技术解决风控问题(贷款。投资)
美图
医疗 IBM Waston
政治 川普选举 精准信息投放
缺陷:
需海量数据。
单一领域。
缺超级科学家。
无自我意识。
无审美。。。
关于科学家创业
方式:自己创业,技术授权,技术开源,找商业合伙人合作
学校。专注科研。
对于社会:报酬。声誉。资源。时间。
对于大学:参考 斯坦福大学
AFTER:(问答)
No 人脸识别
做识别:巨大数据量。选未做过识别的领域。
Don not care 个人数据(隐私问题)
在AI时代,数据优者胜。
工项链(区块链)开放。
AI极客联合在一起,开源。无收费。
让facebook等投降与开源。
AI会使人失枯燥的职业,但可以使人追求更高的价值。
声音分类识别(对婴儿,老人。。)领域,商业价值一般但是值得做。结合情感识别。
AI于信息安全的结合。
AI医疗:多个医院数据结合起来进行数据训练,获得癌症相关的有效研究数据。
人情感的识别
从表象层面理解和模仿人的情感是可以做到的,但是并不意味着AI存在情感。
#六
TURC
5.13
开幕
李云浩(ACM General Co-Chair)
Alexander Wolf(ACM General Co-Chair)
Vichi L. Hanson(ACM president)
Wen Gao(Vice President of NSFC)
Zhimin Li(ACM China Honorary Advisory Council Co-Chair)
Vinton Cerf(ACM Award Chair)
Robet B. Schnabel(ACM CFO)
Kai-Fu Lee(Sinovation Ventures)
Chuanping Hu(TURC General Co-Chair)
John Lui(TURC PC Co-Chair)
CS 的卓越ideas
Speaker:Robert Schnabel
机械学习
分散点(穷举法暴力解决)
未分散点(投影至多维空间求解)
app:更改人的年龄,更改绘画的艺术风格
gate
overfitting
clustering
hidden structure
应用:交通。决定背景。
In “What” We Trust?
In BlockChain We Trust!
倪明选 澳门大学
Lionel?
gold?
computer?
network?
data:修改,移动,权限
BlockChain 1991
BlockChain 1.0:BitCoin 比特币 /1553.50刀
Cryptography 密码学
Byzantine 拜占庭的
BlockChain 2.0:Smart Contracts
Hyperledger 用于记账
BlockChain Taxonomy 分类法:公共,私有
ISSUE:平均响应时间为10min,每秒传输成功数(7)低,poor Capacity,Wasted Resource,
BitCoin Mining(挖"矿")
Private BlockChain 论文
圆桌论坛 (Panel): Big Data or Brain Powered Artificial Intelligence: Turing or Quantum?
Turing Test:机器能思考?
1.李开复
深度学习≠生物脑神经
生物被自然选择,AI被人类选择(梯度下降)
量子计算:更更更快的算力
进化:生物智能的训练过程
遗传:生物界的迁移学习
AI可用于:深度学习,迁移学习,强化学习,统计学习,决策森林,数据降维,蒙地卡罗搜索,实遗憾最小化
AI将平台化
2.姚期智
title:使量子计算机变快的原因
Crystallography 晶体学:
X-Ray Crystallography
Macro-Biological Molecules
应用
3.Alex Wolf
4.Vinton Cerf
5.高文
6.李向阳
#七
TURC.segbio
基因组,大数据与精准医学(陈润生)
精准医学的核心
组学大数据和图学的结合
组学数据获取与组学数据挖掘
精准医学能使医学发生什么变化?
从诊断治疗到健康保障
个体化治疗,对全民全程的健康保障功能
产业化前景
生物样本和数据
基因测序(转录组)
分子诊断
基于精准医学理念的个性化治疗
实现精准医学要有哪些基础?
组学,大数据:海量数据的获得与挖掘
基因型与表型的关联
精准医学才刚刚上路
基因组,转录组中的挑战:基因组中的暗信息
遗传密码中的编码序列(3%),DNA-转译RNA-蛋白质。
海量数据的处理与挖掘:计算量大;数据增速快,数据信噪比低,样本缺失高;样本量小;有效事件频率低(组织,时期,状态不同)
疾病相关的复杂网络:动态的,有向的,双色的,非线性的
高度异质化
数据共享
创新机遇
基因组研究:非编码序列的运用(生物越高等,其非编码序列占比越多)
转录组研究:非编码序列每时每刻在工作(有功能)
非编码RNA的功能研究:PCGEMI(导致前列腺癌),MALAT-1(导致飞小细胞肺癌),肿瘤干细胞IncTCF7,调控淋巴机制研究,H19(转录本,肿瘤抑制基因)
#八
TURC.segboi
Big Data Analysis and Mining in Microbiome(微生物)
背景
微生物与人类疾病:破腹产,“观音土”,粪便制药
微生物与环境
什么是微生物
人类肠道(微生物)
微生物组学
数据收集与分析
数据分析与挖掘
炎性肠病
挑战
微生物数据分析:高维数据分析,不同数据分别,数据的复杂关联。。。
目标
数据挖掘与整合-NMF(非负矩阵的分解)
微生物数据可视化(t-SNE,拉普拉斯正规化)
项目与结果
海洋生物数据:海洋环境对海洋微生物的影响大于距离
人类微生物数据:肠道微生物(3种)
。。。
#九
TURC.segbio
Integrative Analysis of High-throughput TF Binding Data(黄德双)
介绍
外显子用于翻译
转录因子的绑定的矫正
基于张量的分析
Non-convex 非凸方式
Proposed 推荐方式0
实验
AUC
ChIP-sequence and PWM(位置加权矩阵)
DML Mothed
DiscMLA
FETS
数字编码,联合降维,AUC(矩阵)
结论
#十
TURC.segbio
生物网络与药物靶点的识别(中南大学)
网络(假定为线性系统)
网络与动态模型(控制链)
可控性(调节关系)
网络是可以可控的
判断test:
方法一:rank©=rank[A,AB,…,A^n-1 B]=n,n为节点数
方法二:结构可控,Max{rank[A,AB,…,A^n-1 B]=n},
结构可控一般系统可控
可接近性
Dilation(节点集个数大于临域个数)
steering node:无不可达的顶点(找source SCCs),无dilation(MDS)
MSS=MDS ∪ PDS
找图MSS的最大流的最小花费
药物靶点
Drug Target-Steering nodes
Drugs-Control Signal
CAC Network
#十一
TURC.segbio
Genome Informatics and Its Application in Precision Medicine (基因组信息学在精准医疗中的应用)(叶凯,西安交大)
精准医疗
精准诊断,精准治疗
基于模型的检测(变异预测)
CNV:gain,loss
read-pair
Tandem duplications
#十二
TURC.segbio
Clinical Data Repository in Precision Medicine: Technical Solution and Practice,李厦茂(GeneDock,CEO)
基因检测
智能辅助诊断应用